#Kimi K2 | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#Kimi K2

兩個廣東人的五次撞車，撞出最強開源雙雄的底氣？

摘要：兩個廣東人，撐起中國AI半邊天。千呼萬喚，4月24日上午，DeepSeek終於扔出重磅炸彈，全新系列模型DeepSeek-V4預覽版正式上線並同步開源，在Agent能力、世界知識和推理性能三大維度宣佈達到國內及開源領域領先水平。從2月8日上線測試版至今，其始終保持著神秘的姿態。就在四天前的周一晚上，月之暗面同樣發佈並開源了Kimi K2.6模型，主打長程編碼和Agent叢集能力，在多項基準測試中持平甚至優於GPT-5.4、Claude Opus 4.6等閉源模型。鳳凰網科技統計發現，這已經是Kimi和DeepSeek的第五次“撞車”。不僅如此，這一次雙方在架構層面有了更多吸納與借鑑。就連在資本市場，二者也被拿來並列。據Theinformation報導，DeepSeek正在尋求首輪外部融資，在估值方面就參考了Kimi。一次兩次的撞車或許是巧合，但這兩支中國隊伍顯然已在過去兩年的摸高探索中形成了一種默契。開源策略疊加創新互惠，讓雙方都比既定路線走的更快。中國最強的兩個開源模型，正以一種心照不宣的方式，從兩個不同的方向合力包抄海外巨頭的腹地。五次撞車，蛛絲馬跡越來越多先說前幾天的Kimi K2.6。月之暗面已經有段時間不在單個模型上堆參數了。但從2.5到2.6，模型卻越來越會幹活了。據稱2.6在單個工程任務中持續12小時、發起4000多次工具呼叫，在官方測試中完成從零建構SysY編譯器到通過140項功能測試的複雜任務——官方估算，這相當於4名工程師兩個月的工作量。用楊植麟之前概括的三個詞來說，就是Token效率、長上下文、Agent叢集。DeepSeek V4也有三個關注點，即百萬上下文，兆參數和下半年適配國產算力。在架構層面，V4採用大規模混合專家（MoE）架構，完整版總參數高達1.6兆。創新注意力機制在Token維度進行壓縮，結合DSA稀疏注意力，相比傳統方法大幅降低計算與視訊記憶體需求，1M上下文正式成為DeepSeek所有官方服務的標配。新模型的看點不展開說了，這次想回顧下幾個巧妙的撞車點。Kimi和DeepSeek的“撞車史”，最早可以追溯到Kimi 1.5與DeepSeek R1的發佈時間重疊，當時大家還替Kimi惋惜，認為強者遇強者，是一種壓力。此後，兩邊的發佈節奏重疊次數越來越多，鳳凰網科技此前也報導過《Kimi和DeepSeek又又又撞車》。就拿上下文來說，Kimi其實是國內最早做百萬上下文的，2024年時就提過對應200萬文字，當時長文字一度是Kimi非常亮眼的標籤。不過比較遺憾的是，當時Kimi沒解決成本問題，這次DeepSeek再提長文字，就已經把成本打下來了。這次V4 API標準費率為輸入每百萬Token 0.30美元，快取命中時低至0.03美元，僅為GPT-4o價格的約1/20至1/50。按照人民幣計價，V4-Flash輸入價格僅為1元/百萬Token（快取未命中）、輸出2元/百萬Token；V4-Pro輸入為12元/百萬Token、輸出24元/百萬Token。另外，Kimi下一代模型的亮點其實也是長上下文，但在路線上兩者有點不一樣，DeepSeek探索的是稀疏注意力，Kimi探索的事線性注意力。至此，DeepSeek和Kimi拿出了中國唯二兆已開源模型。開放原始碼的合力，對壘矽谷三巨頭在全球的AI競賽裡，有人負責做0-1的創新，有人負責1-100的工程複製，但難的是前者需要全球範圍內那1%的天才，後者更適合軍團作戰的大廠。過去，外界常常說0-1的創新容易發生在美國，後者容易發生在中國。但從DeepSeek和Kimi開始，0-1的創新開始更多的發生在中國。這給了海外AI廠商巨大壓力。鳳凰網科技瞭解到，梁文鋒在創立DeepSeek之後，對應用和市場都不是最感興趣的，他更在乎底層創新，2025年初的R1以多頭潛在注意力的架構創新擊穿了深度思考的成本。另有行業人士告訴鳳凰網科技，儘管融資曾打亂Kimi的節奏，但在2025年DeepSeek走紅後，Kimi也回歸技術，繼續鑽研底層創新。而Kimi從K2到K2.5，其底層架構與DeepSeek V3一脈相承，本質上是在後者基礎上的規模化擴展。到了2026年， DeepSeek團隊在1月連續發佈的兩篇論文mHC與Engram中，開始大量參考Kimi此前開放原始碼的最佳化器、注意力架構等研究成果。這種中國開源模型在底層技術的你追我趕，讓中國的底層創新形成了良性循環，最終帶動了國內開源陣營的集體逆襲。MIT與Hugging Face聯合發佈的報告顯示，過去一年中國開源模型的全球下載量佔比達到17.1%，首次反超美國的15.86%。全球頭部AI模型API聚合平台OpenRouter的資料則顯示，2026年2月，中國AI模型的呼叫量三周大漲127%，全球前五中佔據四席——包括MiniMax、Kimi、智譜和DeepSeek。一年前，這個數字還不到2%。DeepSeek撬開矽谷視野時，Kimi的市場空間也被打開了；當Kimi在長文字和Agent領域持續突破時，DeepSeek在推理效率上的極致追求又給整個行業帶來了新的參照系。一位業內人士對鳳凰網科技表示，Kimi與DeepSeek的撞車早就已經不是內卷，而是一種“惺惺相惜”——“兩個最強的中國開源模型交替衝鋒，合力圍剿的是海外閉源巨頭。”4月24日凌晨，OpenAI面向付費使用者上線GPT-5.5並官宣API計畫，標準版API定價為每百萬Token輸入5美元、輸出30美元，較前代GPT-5.4翻倍，Pro版更達到輸入30美元、輸出180美元。2026年初，史丹佛HAI發佈的《AI指數報告》顯示，截至年初，美國頂級AI公司Anthropic最先進模型的性能僅領先中國最強競爭對手2.7個百分點。美國私人AI投資高達2859億美元，是中國的23倍。但“用23倍的資本砸出2.7%的差距”，這可能已經不是美國AI的優勢，而是中國AI的護城河。無論是K2.6還是DeepSeek V4，可能都是分水嶺等級的產品。兩者選擇了不同的技術路徑，Kimi深耕長程執行和Agent叢集，DeepSeek聚焦推理效率和極致性價比——但在底層邏輯上又高度一致：用開源打破閉源壟斷，用效率避險算力限制。AGI雙雄格局初現去年輝達帶火了中國AI的御三家，其中就有Kimi和DeepSeek，在輝達GTC大會上，Kimi和DeepSeek也是被用來Benchmark 晶片性能的兩家中國開源模型。近期，鳳凰網科技訪談了多位年輕前沿科學家，也多認為DeepSeek和Kimi有著相似的組織形態與創新環境，都是員工數不多，但人才密度極高。都是從底層技術出發探索AGI，也有著相似的技術前瞻性。他們也都願意吸納年輕人，DeepSeek的核心研究員有非常多年輕人，Kimi也廣納賢才，下放到本科生，甚至是高中生。Kimi與DeepSeek開始有越來越多相似的軌跡，另一個值得關注的維度是晶片。楊植麟在2026年3月的輝達GTC演講台上坦言，“目前普遍使用的很多技術標準，本質上是八九年前的產物，逐漸成為Scaling的瓶頸。”Kimi為此給開源社區貢獻了二階最佳化器MuonClip和Kimi Linear架構。DeepSeek V4則直接選擇了用華為晶片做推理，共同為國產算力生態發展做努力。據楊植麟判斷，大模型的本質是“將能源轉化為智能”，而規模化不是暴力堆砌算力與能源，而是以提升效率為核心。這可能也會是中國開源模型的集體敘事轉變，不再執著於與GPT-5.4、Claude Opus 4.7等對手在benchmark上死磕，而是定義一種全新的價值體系——低成本、高可及性、自主可控。第五次撞車或許不會是中國開源模型最後一次在時間線上的“巧合”。從K1.5借鑑DeepSeek R1的強化學習路線，到DeepSeek V4沿用Kimi的長上下文研究成果，中國的開源力量正在用自己的方式證明：最高效的競爭，是讓對手成為自己生態的一部分。AI競賽的下半場，規則正在由中國開源模型重新書寫。而Kimi和DeepSeek們，無疑是這段歷史最核心的註腳。 (鳳凰網科技)

這一次，梁文鋒和楊植麟隔空握手

真是熱鬧的一周。周一，Kimi剛發完Kimi K2.6；周五，萬眾矚目的DeepSeek V4就來了。這種感覺很熟悉。過去一年，這兩家公司不是前後腳發模型，就是前後腳發技術論文，不是你把市場熱度點著了，就是我把技術討論接過去了。更早之前，說起中國開源模型，幾乎條件反射地想到DeepSeek。尤其是DeepSeek發佈R1之後，這家公司不僅憑一己之力改寫了全球市場對中國AI的印象，而且喚醒了其他中國的AI創業團隊的“信心”。於是，我們看到，更多的中國AI創業團隊開始做出非常競爭力的模型，帶來非常有影響力的技術研究成果。2025年7月，被《自然》雜誌稱為“又一個DeepSeek時刻”的Kimi K2模型，在底層架構上首次大規模驗證了二階最佳化器 Muon，同時採用了 DeepSeek驗證過的 MLA注意力機制。到了2026年4月，DeepSeek V4在架構上也跟進 Kimi K2採用 Muon最佳化器，取代過去已經使用了10年的Adam最佳化器。這可能是開源最大的價值：讓中國公司共享技術，加速追趕美國的閉源巨頭。它們是中國目前唯二，總參數超過兆、已權重公開的中國模型。也是最有國際影響力的中國AI模型代表。全球市值最高的輝達公司在展示下一代晶片性能時，用的模型正是來自 DeepSeek 和Kimi。不僅如此，他們也都在挑戰深度學習網路的底層架構，DeepSeek有mHC殘差連接，Kimi有引發矽谷核心技術圈討論的“注意力殘差”。A雖然說DeepSeek V4和Kimi K2.6在同一周發佈，但其實兩個模型各有技術側重點。V4的核心突破在於百萬上下文的成本重構，它通過全新的混合注意力機制，將單token推理的計算量壓縮到V3.2的27%，KV Cache降至10%。這套方案結合了壓縮稀疏注意力和重度壓縮注意力，讓百萬級上下文從技術演示變成了可以普及的基礎設施。V4同時針對agent場景做了專項最佳化，後訓練階段把agent作為獨立方向單獨訓練，工具呼叫格式從JSON換成帶特殊token的XML結構，跨輪次推理痕跡在工具呼叫場景下完整保留。DeepSeek還自建了名為DSec的沙箱平台，單叢集可並行管理數十萬個沙箱實例，用來支撐agent強化學習訓練和評測。K2.6的方向則更偏向長程編碼和agent叢集。它在Kimi Code Bench內部評測中得分68.2，比K2.5的57.4提升約20%。最高可支援300個子agent平行完成4000個協作步驟。B2025年2月，Kimi 發佈 Moonlight系列模型，首次將二階最佳化器Muon應用於480億參數的大模型，驗證了新一代最佳化器的效果。2025年4月，Kimi-VL模型發佈，在Moonlight模型的技術上，引入MoonViT視覺編碼器，為之後的多模態理解模型打下基礎。2025年7月，Kimi首次將Muon最佳化器擴展到兆參數的規模，推出 K2 開源模型。2025年10月，Kimi發佈Kimi Linear，這是Kimi提出的一種線性注意力架構，核心目標是在保住長上下文能力的同時，把大模型處理超長文字的計算和視訊記憶體成本降下來。這說明楊植麟已經不滿足於只做模型了，他想對模型的底層架構動手。隨後，Kimi發佈並開源支援圖片和視訊理解的兆參數模型Kimi K2.5。2026年3月，Kimi發佈注意力殘差的論文，繼續對Transformer的底層結構下手。這篇論文在X上收穫了馬斯克本人的稱讚。在然後就到了前幾天的K2.6，這是一個圍繞長周期編碼、agent執行、工程任務能力的模型。從產品定位的演變可以看出，Kimi正在從消費級對話產品往生產力工具轉型。2026年3月，楊植麟在輝達GTC大會上發表演講，系統介紹Kimi技術路線，他用三個關鍵詞概括Kimi的Scaling策略：Token效率、長上下文、agent叢集。他表示，要推動大模型智能上限的持續突破，必須對最佳化器、注意力機制及殘差連接等底層基石進行重構。當前的Scaling已經不再是單純的資源堆砌，而是要在計算效率、長程記憶和自動化協作上同時尋找規模效應。一家公司最怕的是，只有媒體在討論你，開發者卻不用你。但Kimi不一樣，無論是在OpenRouter上還是絕大多數agent工具的默認介面裡， K2.5和K2.6都是主流選項。截止發稿，Kimi和DeepSeek都出現在OpenRouter的TOP3模型裡，在AA的榜單上，K2.6甚至暫時佔得先機。而在K2.6這裡，模型繼續強化agent、長任務、編碼能力，也是同一個訊號。楊植麟真正押注的，就是生產力場景。這也是Kimi這一年最關鍵的變化。它不再只是告訴使用者“我能幫你讀更長的檔案”，而是在回答更底層的問題，模型怎樣才能在更長時間、更複雜任務、更高工具呼叫密度下保持穩定？長上下文解決的是記憶和資訊承載；線性注意力解決的是成本和擴展性；agent叢集解決的是複雜任務拆解；程式設計能力解決的是模型的理解和執行。它們看起來是幾條不同產品線，其實背後指向同一個方向，Kimi想把Kimi從一個好用的聊天窗口，變成可以承接真實工作的基礎模型。4月，楊植麟受邀參加總理主持的經濟形勢專家和企業家座談會，作為唯一的大模型創業者代表發言。這個1993年出生的年輕人，成為座談會上最年輕的參會者。一個月前，他剛在2026中關村論壇年會全體會議上發表演講，系統闡述了中國AI團隊如何通過底層架構的“推倒重建”，打破沿用十年的行業技術標準。顯然，Kimi已經從一家創業公司，變成了代表中國AI技術路線的符號之一。Kimi這一年的成長路徑，和DeepSeek的路徑有明顯差異。兩家公司的技術選擇不同，但也正因如此，才讓中國開源模型有了更多可能性。C過去我們寫這兩家公司，容易寫成“誰的模型好”、“誰才是下一個OpenAI”。但這其實是個誤區。DeepSeek和Kimi，不該被簡單理解成“誰贏誰輸”。它們更像中國開源模型對外競爭的兩條腿。不存在誰取代誰，而是應該互相刺激互相促進。DeepSeek和Kimi相繼證明了一件事，做前沿模型不一定需要無限的資源，關鍵在於演算法創新和工程最佳化。它們在模型演算法、工程效率、開源路線和降低推理成本上的貢獻，仍然是中國AI過去一年最重要的技術事件之一。它們彼此競爭，但也彼此抬高了中國開源模型的上限。真正重要的不是它們誰先到終點，而是它們把中國模型的競爭維度拆開了。過去我們評價一家模型公司，很容易只看榜單、參數、價格、發佈會聲量。但模型公司真正的護城河，已經不再是“模型聰不聰明”、“模型性能如何”這些事了。現在圍繞模型的敘事，是它能不能形成一整套技術路線。DeepSeek把第一件事做得很徹底。它讓外界看到，中國公司可以用更高的工程效率，把模型訓練和推理成本打下來，可以把技術報告寫到足夠透明，可以把權重開放到足夠激進。它建立的是一種開源信任。開發者願意研究它、復現它、部署它，是因為它不只是給了一個API，而是把模型背後的方法論也拿了出來。Kimi補上的是另一塊。Kimi最早被使用者記住，是因為長文字和聊天產品，但K2.6之後，它講的已經不是一個更會聊天的助手，而是模型如何進入真實工作流。長程編碼、Agent叢集、工具呼叫、長周期任務，這些能力沒有“霸榜”那麼直觀，但它們決定模型能不能從“被試用”走向“被依賴”。如果說DeepSeek解決的是模型夠不夠強、夠不夠便宜、夠不夠開放的問題，Kimi更關心的是模型能不能真的替人完成複雜任務。所以這兩家公司放在一起看，意義反而更大。作為觀察者和使用者，我們肯定希望都存在，這樣產業才能發展。中國AI真正值得興奮的，不是終於出了一個DeepSeek。而是在DeepSeek的帶動下，Kimi們依然能靠自己成長為一座座大山。這說明中國AI公司已經開始在不同維度上找到自己的位置，不再是簡單模仿，是真正的在探索自己獨有的那條技術路線。DeepSeek和Kimi的技術互相賦能，也說明了一件事，開源生態的價值在於協作。現在的問題不是DeepSeek和Kimi誰更強，而是它們能不能繼續保持這種競爭關係，繼續在技術上互相刺激。中國開源模型要真正在全球站穩腳跟，需要的不是一家獨大，而是多家公司在不同方向上都做到世界級水平。DeepSeek和Kimi的存在，讓這個可能性變得更大。 (字母榜)

馬斯克撕破了一塊遮羞布

AI競爭這件事上，攻守之勢正在發生變化。也許很多年後，人們才會意識到，轉折點，只是當時的一件“小事”。（一）這幾天，一場堪稱“AI世紀打假”的戲碼在全球科技圈上演。矽谷當紅炸子雞AI程式設計巨頭Cursor，高調發佈其“自研”的Composer 2模型。然而，全球開發者卻在程式碼中抓到了致命問題——模型ID赫然顯示為中國產大模型Kimi K2.5。一家正在尋求500億美元估值的矽谷明星企業，其最核心的競爭力，竟然必須悄悄建立在一個來自中國的基礎模型之上——而且，開發這個模型的公司估值僅有180億美元。這簡直滑天下之大稽，一時間，全網AI從業者嘩然。更有意思的事，開發者這個模型的中國公司，4天前剛剛才給了矽谷技術圈一個小小的震撼。到底是咋回事？還得從技術底層聊起：這兩年讓AI技術深入生活的，大部分是“大模型”產品，普通人能跟AI直接對話，讓它幫忙工作、做視訊、出主意，都是因為它能進行“邏輯推演”，這背後，源自它名為Transformer的核心元件，這個核心元件的底層，則用了一種叫“殘差連接”的主要邏輯。這個殘差連接不得了，它堪稱現代大模型的基石，不管是長文字理解、複雜邏輯推理，還是多輪對話，模型都靠它保證深層網路的穩定訓練和資訊傳遞。但是，這種連接還是不完善的，用久了，大家就發現了一個核心痛點——層數越深，殘差裡的有效資訊越容易被稀釋，早期層的關鍵資訊直接被埋住。這是阻礙大模型的能力進一步變強的絆腳石之一。而就在3月16日，中國大模型廠商月之暗面，也就是發佈了Kimi的公司，發佈了一份名為《注意力殘差》的技術報告，從底層邏輯的層面，對Transformer架構的關鍵元件殘差連接進行了其發佈十年來的首次重大重構。簡單來說，就是Kimi為大模型這整個“物種”的基礎架構層，提出了一套新的思考路徑，讓其找到全新的進化空間。這一成果，讓馬斯克關注到了，並評價為“印象深刻”。緊接著，就有開發者發現一個問題：這個中國模型的名字怎麼有點眼熟？它似乎出現在矽谷自研的前沿模型 Composer 2的底層程式碼裡。馬斯克確認了這件事，並在社媒上轉發，一錘定音，輿論嘩然後，“冒用者”Cursor也坐不住了，其聯合創始人Aman Sanger發表聲明“服軟”：“我們系統評估了眾多開源基座模型，Kimi k2.5被證明是世界最強的。”這毫無疑問是揭開了一塊“遮羞布”：矽谷公司引以為傲的技術創新大廈，其地基正在被悄然置換為中國製造。（二）矽谷可不是僅僅是一個地名，它幾乎是全世界頂尖人工智慧人才嚮往的聖地，是美國在AI競爭中最不可替代的基石。它的品牌，是幾代精英，用幾十年來鑄造的。矽谷何以為矽谷？這背後有兩個關鍵“定量”：第一，必須始終保持創新，保持對全世界的技術優勢，甚至讓這裡的思想，成為引領全世界技術進化的方向；第二，必須能夠輸出標準，這裡不僅僅是科技領域的技術標準，還包括了很多產業範式，比如AI領域一貫堅持的“開源協作”。但是，當馬斯克撕開了遮羞布，這兩大基石就產生動搖了。“還能相信矽谷嗎？”有人在社交媒體上反問。懷疑的種子一旦種下，命運的齒輪也就開始轉動了。越來越多的人發現，不能只關注矽谷故事，還應該多看看中國成果。這一看不要緊，原來，除了矽谷的初創公司開始拋棄昂貴的專有模型，轉向開放原始碼的中國版本之外，從Airbnb到德國工業巨頭西門子，已公開使用中國模型。市場在用腳投票，資本也沒閒著。以這次事件的主角Kimi為例——它在3個月內估值翻4倍至180億美元，增速超過了同期的字節和拼多多。正如全球最大AI社區Hugging Face聯合創始人直言：“中國開源已成為塑造全球AI技術堆疊的最強驅動力。”其實，中國的AI企業在起步之初，也都深受矽谷影響。在矽谷巨頭面前，始終保持學習者的姿態。但現在，跑道上的差距正在縮短：追趕者正加快腳步，逼近領先者。這不是單純的臆想，實際上，除了目前已經發生的改變，還有邏輯上的必然。Kimi為什麼能成為被競爭對手選定，甚至不惜冒險隱身使用的“世界最強開源基座模型”？這看起來只是一次偶然的事件，但在偶然背後，一定是必然。在被矽谷巨頭點贊之前，市值800億美元的全球網際網路基礎設施巨頭Cloudflare宣佈在生產環境中部署Kimi K2.5後，其內部安全審計Agent（日處理70億Token）的營運成本直降77%，效率也有明顯的提升，這背後，固然有中國AI 通過“兆MoE架構”和“原生多模態理解”等技術優勢的原因，但更重要的，是因為這個模型做到了“性能和價格的最佳平衡點”。正如同中國製造一樣，中國大模型也有自己的獨特優勢，比如，它進化快，它成本低。而這兩個優勢，本質上，其實指向一個關鍵點：中國在AI時代的“基建優勢”，正在成為AI競爭的勝負手。（三）這兩天有個新聞：Token出海，很轟動。媒體說，過去一年，中國大模型的海外付費呼叫量呈現爆發式增長，今年，這個趨勢更快。這裡有倆關鍵詞：第一，Token，它剛剛有了一個中文名詞元，簡單來說，就是大模型運算時需要消耗的基礎貨幣。第二，海外付費呼叫量，指的是海外個人、企業充值來使用中國大模型生產的Token。這個資料，簡單來說，就是世界上花錢使用中國大模型的人數正在變多。為什麼？一方面當然是因為中國大模型越來越好用，另一方面，是因為成本，簡單來說就是，中國電力優勢正在轉換為算力優勢，讓詞元——Token的定價，遠低於國外。這可不僅僅意味著中國將為全世界提供廉價的算力，更意味著中國AI產業從此刻起，就擁有了“近水樓台先得月”的發展環境。試想一下，當中國大模型通過性價比更高的Token，服務全世界的使用者時，它的成長速度一定會超過矽谷的同行，這一東昇西落的趨勢是不可逆的，且會逐漸加速的。轉折點已經不遠了，因為端倪確實已經出現：目前，頂尖中國大模型的海外呼叫量正在成倍增長。而你追我趕的國產大模型，在關鍵指標上與國際頭部模型差距持續縮小；並且，是中國，出現了DeepSeek、Kimi這樣敢於打破範式，試圖重構底層邏輯的突破者。其實，Kimi被冒用這件事，最後的結果很“平和”——事情發生後，月之暗面並沒有禁止矽谷巨頭使用自家產品，而是順勢發文祝賀，落落大方地寫道：“We are proud to see Kimi K2.5 provide the foundation。”用中文說，就是“我們很自豪看到Kimi K2.5 奠定基礎”。相信矽谷一定不願意看到這樣平和但堅定的話語，因為這等於釜底抽薪，改變了矽谷對於未來技術的定義權。用一個比喻來說就是：矽谷長期在打造豪華跑車，引領行業發展，結果有一天，一輛新跑車被人打開，一看發動機是來自中國的，那麼，距離中國人重新定義高級跑車的時間已經不遠了——更何況，中國還在全世界修高速公路。矽谷的巨頭們甚至不敢正視“中國AI技術的崛起”，因為當他們一旦承認中國實驗室正在以更高效、更開放的方式推動行業進步，中國的基礎設施又好又便宜，矽谷的神聖地位就不復存在了，而當全世界的AI企業都把目光轉向東方，那個“我們需要 10000 億美元才能建構 AGI”的融資敘事還會好使嗎？（四）馬斯克揭開的，絕不僅僅是矽谷的遮羞布，而是矽谷的命運線——它將指向一個必然的結果：全球AI的發展範式不只有“矽谷發明-全球應用”這一個軌道，還有“中國創新-全球受益”新軌道。中國通過DeepSeek、Kimi等公司證明，新質生產力不僅是更高效的生產工具，更是一種可定義成本、可制定規則、可輸出生態的全球性基礎設施能力。它包含了重寫架構標準的技術定義力，定義能效與Token價格的成本定價力，繼承並行展開源協議治理的生態規則力和定義綠色、普惠的AI路徑的發展話語權。“中國AI崛起”，崛起的不是簡單的GDP數字，而是這種定義下一個時代發展基座的系統能力。當越來越多的全球智能，開始運行在由中國定義效率、成本和規則的基礎之上時，時代將被誰塑造，已經不言而喻。 (牛彈琴)

中國AI大模型霸榜！

春節期間國產大模型的使用情況可謂如火如荼。OpenRouter最新周度資料顯示，平台前十模型總token量約8.7兆，中國模型獨佔5.3兆，佔比61%。當周token呼叫量前三模型均為國產大模型，分別為Minimax M2.5、Kimi K2.5、GLM-5，呼叫量環比上周分別變動增加197%、下降20%、增加158%。其中，MiniMax M2.5以2.45兆token空降榜首，Kimi K2.5以1.21兆緊隨其後，智譜GLM 5和DeepSeek V3.2分列第三、第五。OpenRouter是全球最大的大模型API聚合平台，可為開發者提供統一API介面，以訪問全球數百種大語言模型。其核心功能包括多模型呼叫、智能路由最佳化和透明的性能排行榜，旨在解決多模型整合複雜和廠商封鎖問題。從該平台提供的資料看，程式設計（Coding）和智能體（Agent）正成為大模型的兩大核心比拚點。OpenRouter整體呼叫量近期大幅攀升。官方確認，M2.5帶動了100K至1M長文字區間的增量呼叫需求，這個區間正是智能體工作流的典型消耗場景。論token呼叫量，在此平台排名前三的國產大模型都聚焦於提升程式設計能力和智能體（Agent）任務的自動化水平，是2026年初國產大模型在應用層面的重要突破。稀宇科技（MiniMax）於2月13日發佈MiniMax M2.5，稱該模型為全球首個為智能體場景原生設計的生產級旗艦模型。其發佈後七天的呼叫量即突破3.07T tokens，憑藉在程式設計和Agent工作流中的卓越性能與極低的成本，成為開發者首選。月之暗面（Moonshot AI）於1月27日發佈KimiK2.5，該模型採用原生多模態架構，能通過調度多達100個“Agent分身”平行工作，將複雜任務效率提升3到10倍。該模型在多個細分榜單（如程式設計、工具呼叫）中均排名第一，其呼叫量遠超Gemini 3和Claude模型。據澎湃新聞報導，該大模型發佈不到一個月，Kimi近20天累計收入已超過2025年全年總收入，增長主要受全球付費使用者及API呼叫量大漲共同推動，其中海外付費使用者數快速增長。智譜於2月12日發佈GLM-5，該模型參數規模進一步擴展，採用了稀疏注意力機制，是其專為複雜系統工程與長程Agent任務設計的旗艦模型。憑藉免費、200K上下文窗口等優勢，該模型發佈後使用者迎來高速增長，智譜對Coding Plan先後進行了限售、漲價等動作，除夕當天官宣全網尋找“算力合夥人”。隨著AI模型應用場景深化，使用者從簡單問答轉向複雜工作流，如讓模型重構程式碼、改寫檔案、生成文件等，以及智能體模式普及，當前token消耗呈現明顯的“通膨”趨勢。性能提升的同時，國產模型仍以性價比優勢出圈。如MiniMax M2.5和智譜GLM-5相比Claude Opus 4.6具備顯著的成本優勢：在輸入環節，MiniMax M2.5與GLM-5的價格均為0.3美元/百萬token，而Claude Opus 4.6則高達5美元/百萬token，是前兩者的約16.7倍；在輸出環節，MiniMax M2.5的價格為1.1美元/百萬token，GLM-5為2.55美元/百萬token，而Claude Opus 4.6的輸出價格達25美元/百萬token，分別是MiniMax M2.5的約22.7倍和GLM-5的約9.8倍。上述國產模型並不能完全反映國內模型廠商的token呼叫量情況。據海通國際證券，資料顯示，火山引擎的大模型日均token呼叫量已從2024年底的2兆增長至2025年底的63兆；阿里雲外部客戶2025年日均token呼叫也已接近5兆，2026年目標至少15-20兆，內部業務日均呼叫則計畫從16-17兆拉到100兆。從全行業看，中國整體日均token消耗2024年初為1000億，2025年中突破30兆，2026年2月主流大模型合計日均token消耗已到180兆等級。東莞證券最新研報表示，隨著國產模型的程式設計、智能體能力提升，其呼叫量大幅增加，國產大模型在程式設計、智能體領域對標全球頭部模型，有望進一步加快應用落地，加速token消耗量上漲。長江證券此前表示，隨著程式設計和多模態模型和產品的逐步成熟，下游應用場景有望被真正打開，帶來大量的高品質token需求。參照海外AI產業發展規律，從資本開支投入到token需求爆發存在約兩年的滯後期。國內大廠的AI資本開支周期較海外滯後約一年，於2024年下半年開啟。因此，國內雲廠商收入已開始兌現增長，而token數量的真正爆發預計將在2026年到來。 (科創板日報)

春節 AI 模型大戰，誰是最大贏家？

國產大模型春節集體轉向「實幹派」，全球 AI 變革看北京。2026 年開年的科技圈，一場靜默的排位賽正在悄然改寫 AI 大模型世界的規則。1 月 27 日，月之暗面開源 Kimi K2.5，以「Agent Swarm」技術實現 100 個子智能體平行協作，將複雜任務執行效率提升數倍；2 月 7 日，字節視訊生成模型 Seedance 2.0 正式上線，憑藉多模態參考系統與原生音視訊同步能力引發全球創作者追捧；2 月 11 日深夜，智譜 AI 發佈新一代旗艦模型 GLM-5，在全球權威榜單 Artificial Analysis 中位居全球第四、開源模型第一。此外，阿里 Qwen3-Max-Thinking、DeepSeek-OCR2、生數、銀河通用、智源等模型也在同一時段密集亮相。海外廠商同樣動作頻繁。2 月 5 日，OpenAI 發佈 GPT-5.3-Codex 程式設計模型，並推出企業級 AI Agent 平台；同日，Anthropic 發佈 Claude Opus 4.6，不到半月後又推出定價更低的 Claude Sonnet 4.6 主攻智能體場景。諸神之戰，不一而足。幾乎所有公司都選擇在一個特殊的時間窗口登場——春節前後。傳統認知中，春節是使用者注意力分散、媒體曝光度下降的時段，並非科技產品發佈的黃金窗口。但 2026 年的這波集中發佈，恰恰利用了春節的場景豐富性：充裕的假期時間、家庭聚會、出行規劃、內容創作、社交娛樂。在全民行為高度集中的這一檔口，正是檢驗大模型能否從實際應用層面解決複雜任務的最佳測試時機。現在看來，這個時間節點絕非巧合，其背後的產業升級意義意味深長——這是國產大模型的一次集體轉型。在過去兩年，國產大模型更像是實驗室裡的「做題家」，核心解決的是使用者提問到模型作答的及時交付，比拚的是 benchmark 分數與響應速度；而這一波 AI 大戰，已經能夠清晰地看到，國產大模型正在向能真正處理複雜任務的「實幹派」轉變。模型不再滿足於給出答案，而是要獨立完成從理解需求、拆解任務、呼叫工具到交付成果的全流程。而我們發現，在這輪「實幹能力」的競賽中，一個值得注意的現像是，領跑者的地理坐標高度重合——它們大多聚集在北京海淀區。理解這種「海淀基因」，才能釐清國產大模型轉型的深層原因。01更加務實的智能軍團雖然這一輪國產大模型的集中發佈尚未結束，不過一個顯著的趨勢已經展現——更務實的評測維度正在取代傳統指標。過去對 AGI 的烏托邦式憧憬，正被算力成本與落地成效的硬約束快速拉回地面。無論是舊金山灣區還是中國一二線城市，資本與產業都已不再為單純的規模擴張敘事支付溢價——大模型正在從單純的技術探索，加速進入技術與需求雙向賽跑的商業化深水區。通俗一點來說，大模型不再只追求標準答案，更在考察在開放環境中的任務完成度，以及如何直接應用到普通人的生活中。此刻扎堆發佈的大模型，紛紛順勢而為。智譜發佈的 GLM-5 在這一輪的表現中頗為搶眼，其在 HumanEval 程式碼通過率達到 96.2%，不但超越前代 GLM-4.7 的 88.5%，更是超越了強勁的 Claude Opus 4.5（95.8%）。但比分數更重要的是，GLM-5 原生支援跨檔案程式碼重構，並能處理複雜系統工程程式碼倉。這意味著，智譜大模型已完成從「初級程式設計師」到「總架構師」的進化，重新定義了程式設計領域的生產力。而在過去專注「聊天」和提供情緒價值的字節，也同樣呈現務實轉向。以前做 AI 視訊，使用者得跟機器猜謎——寫一堆提示詞描述「夕陽下的古風少女」，結果出來可能是古裝也可能是和服。而在 2 月初發佈的字節 Seedance 2.0，則讓指向更清晰明確——用那個色調、某個角色的臉、那一段視訊裡的動作，甚至放段音樂讓它跟著節奏剪。這種多模態參考機制將創作主動權交還使用者，降低了反覆偵錯的試錯成本，使電商廣告、短影片製作等商業場景的產出更為穩定。也與海外模型形成對照：當 OpenAI 的 Sora 和Google Veo 2 仍主要依賴文字提示詞時，Seedance 2.0 將創作更貼近商業場景對確定性的需求。今年春晚舞台視覺《賀花神》的四季花神場景，正是該能力的落地展示——以四時花卉為主題，十二位演員對應十二種花神，每一個出場都伴隨著專屬場景。這背後正是字節大模型的圖像與視訊生成能力起到的作用，為節目定製「一月一人一景，一花一態一觀」的視覺效果。春晚賀花神效果圖打破邊界的，還有大模型的另一種存在載體——具身智能。1 月 8 日，銀河通用發佈多載機器人 Galbot S1，實現零遙操全自主作業，雙臂負載達 50 公斤。與特斯拉 Optimus 等海外人形機器人側重工廠場景不同，Galbot S1 的手腦協同設計更聚焦室內泛化能力——春晚上銀河通用與沈騰、馬麗的互動展示，正讓我們看到了機器人手腦一體的無限可能，未來無數室內場景的泛化能力正源於具身智能大腦模型的佈局。銀河通用春晚節目圖AI 從數字世界來到物理世界，大模型公司正在用一條相對紮實的路，在填補過往實用性不足的坑——聽懂人話、把事情幹成。這和人們通常所理解的商業溢價的區別是，AI 普惠化不是市場競爭手段，而是技術發展的目的。2025 年，國產大模型對行業標竿的理解發生了根本轉變。技術評測的領先僅證明能力上限，而商業價值的衡量標準已轉向規模化的可及性與經濟性——單位算力所能支撐的實際產出效率，成為更具份量的評判維度。市場端的反饋更為直接。經過兩年多的技術演示期，無論是企業還是終端市場，都在提出更為具體的需求：模型能否自動處理報銷流程，能否協調多個軟體完成市場調研，能否在無人監督的情況下執行周期較長的項目。大模型的實際執行能力已成為企業採購決策的核心考量，推動研發方向從追求技術突破轉向保障交付質量。春節場景為產品實用驗證提供了特殊環境。家庭聚會涉及菜譜生成、採購規劃、智能裝置控制等協調需求；長途出行需要整合交通預訂、酒店比價、行程最佳化等多平台資訊；內容創作則要求模型理解節日文化、平台調性及傳播規律。這些任務無法通過單次問答完成，需要模型具備任務分解、工具呼叫、異常處理及結果整合能力。2026 年春節的集中發佈，實質是廠商將產品置於真實場景的壓力測試，假期積累的使用者反饋將為後續產品迭代提供資料支撐。02 海淀基因當技術理想主義與商業現實主義融合時，「覺醒」往往發生在一片讓創新既能紮根又能拔節生長的土壤上。放眼全球，人工智慧的競賽早已超越單一企業的角力，演變為區域創新生態的系統較量。矽谷憑藉史丹佛-伯克利的人才輸送、風投體系的成熟配套、以及「快速試錯」的文化基因，長期佔據全球 AI 產業的高地。但 2026 年春節檔的集體爆發，清晰地顯示出中國創新版圖正在形成自己的「強節點」——北京海淀便是其中最具代表性的樣本。在這片 430 平方公里的地界上，創新的密度可以被具象化地測量出來，在這裡，15 分鐘車程幾乎就能構成一個創新單元——智譜 AI、百川智能、面壁智能……他們齊聚在清華科技園裡。往東一公里，生數科技在中關村東路 8 號東昇大廈探索多模態生成，與智源研究院的成府路 150 號（清華南門）隔街相望。往南一點，月之暗面在知春路 76 號京東科技大廈迭代長文字模型，與字節跳動的大鐘寺工區直線距離不到 3 公里——後者旗下的 Seedance 團隊正依託這片人才密度，在多模態視訊生成領域快速推進。更具縱深感的是人才的流動與重組。愛詩科技創始人來自字節視覺團隊，辦公室設在蘇州街，與原工區直線距離 2 公里；而銀河通用、星動紀元、靈心巧手三家具身智能公司，則集中在海淀區的核心地段，彼此車程都在 15 分鐘內，卻各自探索多載機器人、人形機器人、靈巧手等不同路線。這種集聚並非偶然，而是產業生態的必然結果。北京海淀，作為全國人工智慧產業的核心集聚區，其角色值得客觀審視——它並非簡單的「政策普惠」或「資本密集」，而更像是基礎研究到真實落地的完整鏈條。具體而言，海淀區已經建構了一個基本自主可控的全產業鏈技術體系，底層有清華、北大等高校的前沿研究輸出人才和方法論；中間層由晶片、雲端運算等基礎設施企業提供算力支撐；應用層則有大量場景型企業提供測試環境和需求反饋。這種密度使得技術迭代周期顯著縮短。生態的成熟度，直接塑造了國產大模型的差異化路徑。與矽谷巨頭追求「通用智能」的宏大敘事不同，海淀系企業更強調「垂直穿透」：在這裡，百度佈局全端、寒武紀佈局晶片、智譜清研專注 B 端、快手可靈偏向文娛落地、字節偏向 C 端、月之暗面偏向長文字思考。各尋其位，各盡其能。事實上，政策環境的演進同樣關鍵。2023 年，北京市率先出台地方性大模型產業支援政策，海淀區同步提出建設 2300 億元規模的核心產業叢集，配套人才落戶、資金扶持、場景開放等綜合措施。如今這一資料已經超過 3500 億。同時，海淀推出中關村科學城科技成長基金，經過三期發展規模已達 200 億元，明確將投資重心前移，聚焦早期項目、小型企業、長期價值及硬科技領域。這種「耐心資本」的供給，顯著改善了創新型企業的心理預期與風險偏好。但海淀的真正價值，或許不在於政策紅利的獨享，而在於其作為「創新方法論」的輸出地。從 2010 年代中關村的創業大街，到移動網際網路時期的「巨頭搖籃」，再到如今的大模型集聚區，海淀始終扮演著技術商業化「加速器」的角色。早期的網際網路創業培育了風險資本的敏銳度、工程師文化的務實性，以及對「快速迭代、小步快跑」方法論的路徑依賴。這些基因延續至今，使得中國企業在面對大模型這一顛覆性技術時，表現出更強的工程化能力和商業化嗅覺。AI 原點社區將視野拉寬，這種「強節點」的崛起並非孤例。上海的張江、深圳的南山、杭州的餘杭，同樣在 AI 產業鏈的不同環節都形成特色優勢——這些都是值得區域學習的樣本。但海淀的獨特性在於其「全端覆蓋」——幾乎每一環都有代表性企業佈局。這種完整性，使其成為全球 AI 版圖中少數能與矽谷形成系統性對話的區域之一。傳統認知中，技術創新高度集中於少數全球城市；但大模型時代的競爭，越來越依賴「資料-場景-算力」的本地化閉環。中國龐大的數位化應用場景、完整的製造業體系、以及政策驅動的算力基礎設施，為區域創新生態提供了獨特的養分。海淀的集聚效應，正是這種國家能力在微觀層面的投射。當全球大模型產業進入「實幹能力」的比拚階段，區域生態的質量將直接決定企業的競爭力上限。03更好的時代所有技術革命的最終走向，一定承載著產業實踐的階段性註腳。這場集中爆發的轉型給產業和區域都提供了新的機會。春節檔的 AI 大戰，標誌著國產大模型進入產業價值驗證的關鍵周期。短期內，市場將迎來一次實幹能力的集中檢驗。期間積累的真實使用者資料與實際交付體驗，將幫助企業精準識別產品短板，加速迭代最佳化。例如，多智能體協作的穩定性、長視訊生成的時序一致性、複雜程式碼重構的可靠性等問題，只有在海量真實互動中才能充分暴露和修正。但大模型軍團現在的表現，已經影響深遠——目前，OpenAI、Google 等巨頭紛紛調轉船頭，開始密集推出針對企業級市場的高性價比推理模型。很長時間以來，全球人工智慧的聚光燈多投在矽谷。而 2026 年這個乍暖還寒的春天，分水嶺已經有了能捕捉的痕跡——算力封鎖沒有擊垮國產大模型，反而帶來了一抹得天獨厚的韌性。AI 製圖這註定是一條長期主義的道路，但不妨礙國產模型技術迭代節奏持續加快，產品更新周期從以年為單位縮短至以月甚至以周計算。這種敏捷響應能力的形成，客觀上為中國人工智慧產業提供了彎道超車的窗口期。而從管理者的角度來看，當大模型從「對話工具」進化為「數字員工」，「人」的身份也將發生變化，其社會影響將呈指數級放大——對於所有區域性政府而言，都需要在新階段裡尋找定位——這要求政策層面在持續降低創新成本的同時，建立適配新技術形態的治理框架。而經驗老道的管理者，顯然能更快提供合格的樣本。至少，站在 2026 年的端頭，國產大模型發展的重要節點。人們已經可以確定，全球新一輪大模型產業變革的方向與節奏，正日益取決於中國創新體系的突破能力與本土生態的支撐強度。 (極客公園)

Kimi K2.5登頂開源第一！15T資料訓練秘籍公開，楊植麟劇透K3

開源熱榜第一輪流做，現在花落Kimi。在Hugging Face上，Kimi K2.5登上了Trending榜首，下載量超過了5.3萬。Kimi K2.5主打Agent能力，在HLE-Full、BrowseComp等測試集中，成績超越了GPT-5.2、Claude 4.5 Opus以及Gemini 3 Pro等旗艦閉源模型。而且極具性價比，在BrowseComp上達到比GPT-5.2更高的表現，Kimi K2.5的資金消耗僅有不到5%。現在，官方的技術報告也已經亮相，Kimi K2.5怎樣練成，我們可以從中窺探一些答案。原生多模態，15T Token混合訓練Kimi K2.5在K2的架構基礎上，投入了15T的視覺與文字混合Token進行持續預訓練。它選擇了一條原生多模態的技術路線，讓同一套參數空間直接處理視覺訊號與文字邏輯。在15T這樣龐大的資料量級下，視覺理解與文字推理能力實現了同步增強，一改往日“此消彼長”的局面。這種統一的參數架構，讓模型能夠像理解語法結構一樣，精準解析像素背後的邏輯語義。有了這套原生底座，K2.5解鎖了“視覺程式設計”能力。因為能在像素層面進行推理，它具備了從視訊流直接逆向推導程式碼的能力。面對一段包含複雜滾動觸發特效或動態互動佈局的網頁演示視訊，模型能夠準確捕捉視覺元素隨時間軸變化的規律，並將其直接對應為可執行的前端程式碼。這一過程跳過了“視覺-文字”的中間環節，讓開發需求能夠以最直觀的視覺形式傳遞給模型，實現了從設計演示到程式碼實現的無損轉化，即便是極其複雜的動態互動邏輯也能被精準還原。為瞭解決程式碼能跑但樣式不對的問題，K2.5還整合了自主視覺偵錯機制，在程式碼生成並渲染出介面後，模型會呼叫視覺感知能力對實際運行的頁面進行驗收。一旦發現佈局錯位、樣式偏差或動畫異常，模型會自動觸發文件查詢工具，查閱相關技術文件定位問題，並對程式碼進行修正。這種“生成-觀察-查閱-修復”的自動化閉環，模擬了高級工程師的偵錯流程，讓模型具備了獨立完成端到端軟體工程任務的可靠性。超大規模“智能體叢集”為了能更好地解決複雜任務，Kimi K2.5還搭載了Agent Swarm架構。這是一套能自主建構百人規模數位化團隊的平行系統，讓模型獲得了“分身”能力，可以瞬間建立並編排多達100個子智能體，並支援呼叫1500個工具的平行工作流。這種機制將全網深度搜尋或海量資料分析等複雜任務，拆解為無數個同步進行的子任務，利用叢集算力大幅壓縮了處理時間。指揮這支龐大團隊運轉的是PARL（平行智能體強化學習）框架。該框架建立了一套嚴密的指揮體系，由核心的調度器和眾多子智能體構成。調度器如同指揮官，負責宏觀層面的任務拆解與分發；子智能體則作為執行層，在參數凍結的狀態下專注於高效完成具體指令。這種動靜結合的設計，既賦予了系統靈活規劃的能力，又保障了大規模平行操作的邏輯嚴密性。為了讓模型學會高效分工，訓練過程採用了一套階段性獎勵塑造策略。系統在初期會優先激勵調度器進行平行化探索，培養其“多管齊下”的直覺；隨著訓練深入，獎勵重心平滑過渡至任務的最終成功率。這種循序漸進的訓練方式，讓模型建立了在保證結果精準的前提下，最大化利用並行優勢的思維習慣。在效率評估上，系統引入了臨界步驟作為核心指標，基於平行計算的關鍵路徑原理，聚焦於調度開銷與最慢子智能體的耗時。這種機制倒逼模型在決策時，必須優先考慮如何縮短端到端的實際等待時間。只有在能切實提升響應速度的情況下，系統才會增加平行度，從而在極致速度與計算資源消耗之間找到了最佳平衡。楊植麟劇透Kimi K3K2.5上線後不久，月之暗面的三位創始人——楊植麟、周昕宇和吳育昕現身Reddit，來了一場長達3小時的AMA問答。面對全球開發者和的提問，他們直接把程式碼背後的思考、未來的劇透甚至尷尬的Bug都攤開來聊了個透。對於大家最關心的下一代Kimi K3，團隊給出了一個相當硬核的預告——它很可能基於線性注意力機制。楊植麟更是直言，雖然不敢打包票，但K3相比K2.5那怕沒有10倍的提升，也絕對會有質的飛躍。針對K2.5偶爾會自稱Claude的趣聞，團隊也給出了坦誠的解釋——這是因為Kimi“吃”了太多高品質的程式設計訓練資料，而這些資料裡充斥著Claude的名字。這就像讀了太多某位作家的書，說話難免帶上對方的口頭禪。此外他們也對算力焦慮問題進行了回應，演算法負責人周昕宇拋出了一句“創新往往誕生於約束之中（Innovation loves constraints）” 。在他們看來，堆砌算力不是通往AGI的唯一路徑，在有限的資源下逼出更高效的演算法、更聰明的架構，才是這家實驗室真正的“登月”野心。 (量子位)

國產大模型Kimi K2.5全球多榜單領先，推動AI向智能體演進

當前，全球AI大模型的技術焦點正從“對話互動”轉向“自主執行”。在這一趨勢中，國產大模型正展現出獨特的價值與影響力。近日，人工智慧企業月之暗面正式發佈並開源新一代大模型Kimi K2.5。作為該公司迄今最智能、最全能的模型，K2.5在視覺理解、程式碼生成與Agent叢集協作等方面實現重要突破，被AI業界視為國產人工智慧發展的又一標誌性產品。2025年初，DeepSeek-R1憑藉極高的推理效率火遍全球。一年後，月之暗面通過原生多模態與智能體能力的深度融合，進一步體現了國產基座模型在提升智能“密度”與實用效能方面的進階。隨著以Kimi K2.5為代表的AI大模型加速賦能千行百業，其廣泛的應用潛力越發凸顯。KimiK2.5模型全球多榜單領先自2023年成立以來，月之暗面先以“長文字”功能打開市場，隨後推出基於強化學習的K系列模型。這次K2.5的發佈，意味著公司在基礎模型研發上再進一步。相比2025年7月發佈的K2模型，Kimi K2.5模型意義重大。多項測試表明，K2.5在程式設計、視覺、推理和Agent（智能體）任務等多個領域達到國際先進水平。K2.5讓AI更“親民”。通過融合視覺、推理、程式碼和Agent能力，使用者現在只需拍照、截圖或錄屏，就能讓Kimi理解複雜需求，大大降低了與AI的互動門檻。發佈不到一周，來自美國、英國、德國、西班牙、新加坡等近20個國家超50家主串流媒體對Kimi K2.5進行了報導。該模型發佈後，迅速登上多個權威評測榜單前列。在第三方評測機構Artificial Analysis的最新榜單中，Kimi K2.5綜合性能位列全球前五，僅次於GPT-5.2、Claude Opus 4.5、GPT-5.2 Codex和Gemini 3 Pro Preview這四款閉源模型，在開源模型中居首。圖為評測機構Artificial Analysis發佈的最新模型排名Kimi K2.5還進一步提升了開源模型的程式碼水平，尤其是在前端開發領域，通過融合視覺能力降低了程式設計的門檻。比如，K2.5能自動拆解錄屏背後的互動邏輯，用程式碼進行完整復現。開發者社區的反響也十分熱烈。大模型聚合平台OpenRouter平台資料顯示，K2.5的呼叫量已進入全球前三，且仍在快速增長。LMArena榜單也顯示，其程式碼能力在開源模型中居首，總榜排名前三，是前十名中唯一的中國模型。知名程式設計工具Kilo Code近期資料顯示，K2.5已成為平台上呼叫量最高的模型。在程式設計的實際應用中，因具備視覺理解能力，Kimi K2.5模型也成為多家頭部大廠的首選，展現出廣泛的行業適配性。對普通使用者來說，Kimi K2.5模型將Agent能力擴展到日常辦公領域，它已具備處理Word、Excel、PPT、PDF等常用軟體的高階技能，能幫助使用者直接交付准專業水平的辦公文件。更值得關注的是，Kimi K2.5首次引入了“Agent叢集”能力，可以自主建立多達100個的數字“分身”，按需組成不同角色的團隊，平行工作，團隊作戰，獲得效率的極大提升。例如，使用者輸入40篇論文後，K2.5會先通讀全文，再派生子Agent分別撰寫不同章節，最後由主Agent整合成一份完整的PDF報告。這種“團隊作戰”模式極大提升了效率。圖為評測平台Design Arena發佈的榜單，Kimi K2.5位列第一最新資料顯示，Kimi K2.5已登上評測平台Design Arena榜單首位。該平台主要評測AI大模型的“視覺+互動+創意”能力，此結果印證了K2.5在“設計智能體”領域的綜合領先優勢。隨著應用場景的持續拓展與技術的穩步迭代，Kimi K2.5有望在全球範圍內推動AI應用走向更廣、更深的落地，為各行各業的智能化轉型提供切實助力。國產AI大模型影響力持續提升Kimi K2.5模型的快速破圈，不僅是國產AI模型的一次“實戰測試”，更是中國開源模式憑藉技術能力和性價比優勢在全球舞台嶄露頭角的重要體現。從DeepSeek-R1以強化學習最佳化實現“效率革命”，到月之暗面Kimi K2.5實現原生多模態與智能體叢集能力的融合突破，國產大模型在技術體繫上完成了從單點突破到系統化創新的範式躍遷，影響力持續提升。大模型能力是人工智慧走向規模化應用的核心基石。Kimi K2.5的發佈，體現了人工智慧行業將加速從“聊天互動”轉向以“自主執行”為目標的智能體新階段。以“Agent叢集”為例，過去工程師需要逐行編寫程式碼的複雜流程，如今僅憑一條自然語言指令，即可調度上百個智能體協同作業、平行處理。業內分析認為，這一從“單一模型智能”向“多智能體群體協作”的躍遷，是企業級AI開發的下一個前沿。當前，智能體技術正逐漸從實驗室走向實際應用，進入規模化落地階段。在政策引導與產業鏈協同創新的雙輪驅動下，中國在場景、資料與工程化方面的優勢持續釋放，為AI產業形成全球競爭力奠定了基礎。在市場與資本的雙重助推下，頭部企業正將資源聚焦於下一代技術的攻堅。月之暗面創始人楊植麟表示，下一代模型將採用Kimi Delta Attention新型線性注意力機制，進一步提升短長文字任務性能與速度。同時，未來的大模型還將具備更多“審美”和“價值觀”，擺脫同質化發展。“我們致力於在未來十年、二十年，推動K系列模型從K4、K5到K100實現代際跨越。”楊植麟表示，當前多款中國開源模型已成為事實上的行業基準，“中國技術不僅要好用，還要參與制定規則”。 (瞭望財經)

看不懂的月之暗面

圖源：視覺中國“這家公司是我目前最看不懂的。”一位國產大模型上市公司的投資部人士這樣評價月之暗面。在他看來，月之暗面的模型能力本身沒問題。讓人困惑的是，這家公司在行業節奏上的走向。1月21日，在達沃斯世界經濟論壇年會上，月之暗面Kimi總裁張予彤表態：“Kimi很快就會發佈一個新模型。”六天後的1月27日，月之暗面發佈並開源了Kimi K2.5模型。這是Kimi迄今能力最為集中的一次更新：視覺理解、程式碼、多模態輸入、思考與非思考模式、Agent及Agent叢集能力，被統一封裝進同一個All-in-one模型之中。發佈視訊中，楊植麟親自站台介紹著K2.5。模型如期亮相，讓月之暗面在技術層面給了外界一個明確回應。但在資本與公司化層面，它卻走在另一條軌道上。過去一段時間，“AI六小虎”開始分化：智譜、MiniMax先後推進上市。幾乎在同一時間，楊植麟稱，公司有100億元現金，並不著急上市。正是在這種對照下，投資人對月之暗面的“看不懂”，變得更具體。進入行業中場，這是在主動放慢節奏，把籌碼繼續押在技術路徑上，還是不得不承認，已經不在第一梯隊？Kimi K2.5，怎麼樣？一位體驗過Kimi K2.5的AI創業者表示，該模型給他的直觀感受是全面聚焦於“生產力”：核心轉向程式設計、辦公與複雜任務協作，而非擴展零散功能。“它不是靠跑分證明自己，而是靠實際產品能力。”他強調，這種在具體任務中的體感差異，比分數更有說服力。K2.5的取向是一次有跡可循的戰略聚焦，標誌著月之暗面在大模型能力譜系中的位置遷移：其技術標籤已從2024年的“長文字”，轉向2025年的複雜推理、思考過程與Agent任務協同。一位接近公司的人士指出，此輪迭代的價值不在榜單排名，而在工程取向——模型圍繞Agent任務反向設計，核心目標是穩定地拆解任務、呼叫工具並保持長鏈路推理的一致性。這一取向，與月之暗面近年來強調的效率優先路線相呼應。公司方面在多個場合提到，自身並不具備無限堆砌算力的條件，因此更強調演算法與系統層面的效率提升，而非單純擴大訓練規模。在K2系列訓練中，月之暗面使用改進版Muon最佳化器，實現約2倍Token效率提升，並通過QK-Clip等機制增強大規模訓練穩定性；在推理側，則提出Kimi Linear線性注意力機制，在保證效果的同時提升長上下文處理速度。張予彤在達沃斯論壇上將這一策略概括為：僅使用美國頂尖實驗室約1%的資源，完成K2與K2 Thinking的訓練。這也意味著，月之暗面對模型能力的驗證路徑，正轉向工程系統導向。這種變化，同樣體現在產品層。自2025年5月起，Kimi密集推出了Researcher、PPT、Kimi Code等Agent功能；9月進一步上線OK Computer，可呼叫虛擬電腦中的工具完成開發、資料分析、多模態內容生成或製作PPT。Agent被放置在模型能力與商業化之間，逐漸成為關鍵中間層。與此同時，月之暗面有意識地將部分能力驗證場景放在海外。公開資料顯示，K2系列模型發佈後，在OpenRouter等模型呼叫平台上佔據一定份額。市場普遍認為，月之暗面不再追求“大而全”的炫技，而是將籌碼押注在“用工程化能力解決實際問題”這一差異化的方向上。這一策略能否成功，關鍵取決於其Agent叢集等核心功能在真實、複雜業務場景中的穩定性和可靠性能否經得起大規模驗證。同時，在面對DeepSeek等同樣強勁的競爭對手時，如何平衡頂尖性能、使用成本與商業化速度，將是月之暗面接下來的核心挑戰。雙重擠壓：資源戰與評價體系之變更早階段，月之暗面曾是國內較早將重心放在C端通用助手上的大模型公司之一。成立初期，憑藉楊植麟的學術背景，公司在行業內獲得較高期待，被部分從業者視作“中國版OpenAI”，月之暗面很早便選擇以產品形態承接模型能力。2023年8月，在首個模型訓練進入後期階段時，月之暗面啟動AI助理Kimi項目。當時公司規模約50人，Kimi在內部更像是模型能力的展示窗口。產品上線後，Kimi月活使用者一度保持較高增長，並通過投放完成冷啟動，在通用對話類產品中進入頭部梯隊。QuestMobile資料顯示，截至2024年底，Kimi月活使用者超過2000萬，僅次於豆包。多位從業者將那段時間視為月之暗面在C端最為風光的階段。但這種增長，很快就遭遇到了成長的煩惱。進入2025年後，隨著字節豆包、騰訊元寶、阿里系產品線同步推進，這一賽道逐漸演變為高度依賴資源投入的競爭。對擁有平台入口和分發體系的大廠而言，投放成本可以被內部消化；而對獨立創業公司來說，持續投流更像一項難以長期承擔的支出。一位接近月之暗面的人士直言：“創業公司很難跟大廠正面拼投流，比到最後，往往是錢燒得更快，使用者卻留不住。”與此同時，行業對“好模型”的判斷標準也在發生變化。2025年初，DeepSeek等模型的崛起重塑了行業的選擇標準：其幾乎零大規模推廣、純靠技術口碑驅動增長的現象，在業內引發了強烈震動。一位月之暗面員工曾回憶，那段時間公司內部感受到的壓力是雙重的，投流層面打不過大廠，技術聲量又被DeepSeek搶走。但這種衝擊，也促成一次內部認知轉向。公司層面逐漸意識到，對技術型創業公司而言，C端通用助手的使用者規模，並不天然構成技術壁壘。相比講使用者故事，更重要的是在模型能力上形成真實差距。上述投資人將這種變化概括為：“過去是先佔使用者，再補模型；現在是模型能力決定你還能不能留住使用者。”在這一判斷下，楊植麟更傾向於將規模視為階段性結果，而非優先目標。在模型能力尚未形成穩定差距前，過早放大使用者規模，反而可能放大資源消耗與路徑誤判的風險。2025年，月之暗面開始對C端業務做出明顯收斂。產品層面，公司逐步停止大規模投流，收縮泛娛樂方向，先後暫停或放緩Ohai、Noisee等多條C端產品線；技術層面，資源重新集中到基座模型訓練與推理能力；市場層面，重心從國內使用者規模競賽中抽離，轉向海外開發者生態與專業使用者場景；戰略層面，公司從閉源轉向開源，並將產品與商業化的主要增量方向放到海外。整體來看，這是一次主動退出C端正面戰場、更換賽場的選擇。但收縮的代價同樣存在。上述投資人表示，從其瞭解的情況看，公司目前“基本只剩下大模型和Kimi這一條主線”，不少其他產品線已經被放棄，“甚至有多個產品線負責人後來離職創業”。分水嶺時刻：當上市成為同行的標準答案戰略上的主動收縮與聚焦，也讓月之暗面在資本路徑的選擇上，展現出與同業公司截然不同的節奏。成立初期，月之暗面展現出極強的融資能力。公司成立僅三個月後即完成超2億美元天使輪融資，投後估值約3億美元；同年7月完成Pre-A輪融資。2024年進入融資高峰期：2月完成超10億美元A+輪融資，估值升至25億美元；8月完成超3億美元B輪融資，估值提升至33億美元。2025年底，月之暗面完成5億美元C輪融資並實現超募，投後估值約43億美元。表：月之暗面融資時間線然而，與強勁的融資表現形成鮮明對比的是，月之暗面在上市處理程序上的“按兵不動”。在多家同梯隊公司相繼啟動上市處理程序的背景下，月之暗面並未同步推進 IPO。對於一家已具備上市條件、且身處高關注賽道的公司而言，這一選擇並不常見。上述投資人提到，隨著智譜、MiniMax 進入二級市場，大模型公司的評估標準正在發生變化：相比一級市場更強調願景與潛力，二級市場更關注成本結構、毛利率水平與商業化兌現節奏。近期多家公司推動上市，本質上仍是現金流壓力下的融資選擇，而非成功與否的標誌。例如，繼 H 股上市後，智譜仍在推進 A 股上市處理程序。中國證監會官網顯示，其輔導機構中金公司已於 2026 年 1 月 15 日遞交輔導報告。這意味著，“大模型第一股”並未止步於單一資本市場。不同公司間的現金狀況，正在成為決定其戰略節奏的關鍵變數。進入2025年底，行業格局進一步分化：12月中旬，同為“AI六小虎”的智譜和MiniMax相繼通過港交所聆訊並開始招股。就在幾天後的12月31日，久未公開露面的楊植麟內部信曝光，披露公司仍持有約100億元現金，並直言“不急於上市”。此後不久，2026年1月13日百川智能創始人王小川也在媒體溝通會上透露，公司帳上存有30多億元現金。三天後的1月26日，階躍星辰完成超50億元新一輪融資，印奇出任董事長。然而，充足的現金並未消除壓力。在看似從容的“不上市”宣背後，楊植麟、王小川和印奇實則面臨著一個共同的難題：僅憑手中的資金，在技術爆炸的窗口期內建立起真正的護城河。實際上，除了對外部技術競賽的焦慮，對月之暗面來說，公司歷史“舊帳”也構成了另一種維度的壓力。有觀點認為，月之暗面早期分拆相關的股權與仲裁問題尚未完全塵埃落定，在這一狀態下貿然啟動 IPO，本身就存在合規與資訊披露層面的複雜性；相比之下，留在一級市場繼續推進技術與產品演進，操作成本更低。上述投資人補充道，他對月之暗面的判斷依然複雜。公司能夠持續推出模型、持續完成大額融資，說明其在技術能力與資本市場層面具備較強說服力；但月之暗面仍未向外界清晰回答產品形態如何確立、商業化如何展開、穩定使用者從何而來等更基礎的問題。在他看來，月之暗面更像是一家技術能力已被驗證，但公司形態仍在形成中的企業。這種技術先行、商業輪廓尚未完全浮現的狀態，也在一定程度上對應了當前國產大模型行業所處的整體階段。 (深網騰訊新聞)